Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) métodos de clasificación (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: métodos de clasificación


Is in goldstandard

1
paper corpusSignosTxtLongLines213 - : Ahora bien, dado que en nuestro caso nos interesa describir el Corpus PUCV-2006 e identificar las similitudes y diferencias entre las disciplinas consideradas en este corpus, compararemos dos métodos de clasificación supervisada, basados en el modelo vectorial: el Bayes Ingenuo (Multinomial Naïve Bayes ) y la Máquina de Soporte de Vectores (Support Vector Machine), con el fin de conocer cuál de ellas es más eficiente en la clasificación de los textos.

2
paper corpusSignosTxtLongLines213 - : Como se mencionó más arriba, los métodos de clasificación a comparar en este estudio son: Bayes Ingenuo (BI ) y Máquina de Soporte de Vectores (MVS). Ambos métodos requieren, en primera instancia, normalizar los datos de la matriz (esto es, la frecuencia en la que los 2.729 lexemas compartidos aparecen en cada uno de los 222 textos) como requisito para la construcción de los espacios vectoriales correspondientes. En general, y como mencionáramos anteriormente, existen más de 200 sistemas de cálculo de pesos para normalizar los datos. En este caso particular seguimos el modelo de Salton (1968), denominado TFC, donde:

3
paper corpusSignosTxtLongLines374 - : Los métodos de clasificación se dividen en dos grupos: aquellos que son métodos supervisados, como es el caso del algoritmo de n-gramas, el cual necesita un conjunto de entrenamiento para crear el modelo del lenguaje que usará el algoritmo para su clasificación, y el segundo grupo es aquel donde no se genera el conjunto de entrenamiento, como es el uso de la ontología, y en este es a través de los datos que tiene la ontología que trata de clasificar los documentos (Dragu, Elkhoury, Miyazaki, Morelli & Tada, 2010 ).

4
paper corpusSignosTxtLongLines374 - : En el [36]Gráfico 2 se muestra la comparación con los distintos métodos de clasificación, utilizados durante este trabajo de investigación, para el tercer nivel de categorización correspondiente a hipoacusia sindrómica e hipoacusia no sindrómica, donde se puede ver el desempeño final de cada uno de los algoritmos . Como se puede observar en la gráfica, el peor resultado lo obtuvo el algoritmo baseline con un 40.6% de asertividad en la clasificación; en cuanto al algoritmo basado en n-grama de letras, tiene una asertividad del 68.1%, y el algoritmo basado en funciones supera al algoritmo de n-gramas con un 79% de efectividad.

Evaluando al candidato métodos de clasificación:


1) algoritmo: 6 (*)
3) bayes: 3

métodos de clasificación
Lengua: spa
Frec: 11
Docs: 3
Nombre propio: / 11 = 0%
Coocurrencias con glosario: 1
Puntaje: 1.943 = (1 + (1+3.32192809488736) / (1+3.58496250072116)));
Candidato aceptado

No se encontraron referencias bibliográficas sociadas al/ alos término(s)

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)